2.1.1 피드백 루프와 PID 제어: 산업 현장을 지탱하는 자동화의 뿌리
1. 서론: 불확실성 속의 질서, 피드백 제어의 본질
인공지능(Artificial Intelligence)과 데이터 기반의 소프트웨어 2.0(Software 2.0) 시대가 도래했음에도 불구하고, 물리적인 세계를 다루는 모든 자동화 시스템의 기저에는 변하지 않는 진리가 존재한다. 그것은 바로 시스템의 현재 상태를 측정하고, 목표 상태와의 오차(Error)를 계산하여, 이를 수정하는 방향으로 입력을 가한다는 **피드백 루프(Feedback Loop)**의 원리이다. 거대 언어 모델(LLM)이 코드를 작성하고 강화학습(Reinforcement Learning) 에이전트가 로봇의 보행 전략을 수립하는 최첨단 기술의 시대에도, 실제 모터에 전압을 인가하고 유압 액추에이터의 밸브를 여는 최전선에서는 여전히 고전 제어 이론, 그중에서도 PID(Proportional-Integral-Derivative) 제어가 중추적인 역할을 수행하고 있다.1
본 장에서는 현대 로보틱스와 자동화 산업을 지탱하는 뿌리 기술로서 PID 제어의 위상을 재정립한다. 우리는 단순히 수식적인 정의를 넘어, 1920년대 니콜라스 미노르스키(Nicolas Minorsky)의 선박 조향 연구에서 시작된 제어 이론이 어떻게 공압식 컨트롤러와 PLC(Programmable Logic Controller)를 거쳐 오늘날의 딥러닝 기반 로봇 제어 시스템에 통합되었는지 그 진화 과정을 심층적으로 추적할 것이다. 특히, 최신 SOTA(State-of-the-Art) 인공지능 기술이 고전 제어를 대체하는 것이 아니라, 오히려 PID 제어 루프를 하위 계층의 ’척수(Spinal Cord)’나 ’반사 신경’으로 활용함으로써 시스템의 강인성(Robustness)과 학습 효율성을 극대화한다는 사실을 규명한다.3 이 과정에서 미분과 적분이 갖는 물리적 의미를 로봇 공학의 관점에서 재해석하고, 수학적 표기법과 해라체를 사용하여 기술적 엄밀함을 유지하며 서술한다.
2. 제어 이론의 태동과 진화: 관찰에서 알고리즘으로
2.1 미노르스키와 조타수의 직관: PID의 탄생
PID 제어의 수학적 정립은 20세기 초, 거대 전함의 조향 안정성(Directional Stability)을 확보하려는 군사적 필요에서 비롯되었다. 1922년, 러시아계 미국인 엔지니어 니콜라스 미노르스키(Nicolas Minorsky)는 미 해군 전함 ’USS 뉴멕시코(New Mexico)’의 자동 조타 장치를 개발하는 과정에서 현대 제어 이론의 기념비적인 논문인 「Directional Stability of Automatically Steered Bodies」를 발표했다.5
미노르스키의 연구는 제어 대상을 수학적으로 모델링하기 이전에, 파도와 바람이라는 거친 외란(Disturbance) 속에서 배의 키를 잡은 숙련된 조타수(Helmsman)의 행동을 관찰하는 것에서 시작되었다. 그는 인간 조타수가 단순히 현재의 방위 오차만을 보고 반응하는 것이 아님을 발견했다. 만약 조타수가 현재의 오차에만 비례하여 키를 조작한다면, 거대한 관성을 가진 선박은 목표 항로를 지나쳐 지그재그로 운항하는 진동(Oscillation)을 겪게 될 것이다. 미노르스키는 숙련된 조타수가 무의식적으로 과거, 현재, 미래라는 세 가지 시간 차원의 정보를 동시에 처리하고 있음을 간파했다.7
첫째, 조타수는 배가 현재 항로에서 얼마나 벗어났는지를 판단하여 키를 조작한다. 이는 현재의 오차 \vert e(t) \vert에 반응하는 비례(Proportional) 제어에 해당한다. 둘째, 조타수는 배가 한쪽으로 지속적으로 밀리는 경향(예: 측면에서 불어오는 바람이나 해류)을 감지하면, 오차가 ’0’인 순간에도 키를 그 반대 방향으로 약간 꺾은 상태를 유지한다. 이는 과거의 누적된 오차 정보를 활용하여 시스템의 잔류 편차(Steady-state Error)를 제거하는 적분(Integral) 제어의 원형이다. 셋째, 가장 중요한 발견으로, 조타수는 배가 목표 항로로 복귀하는 속도가 너무 빠르거나 파도에 의해 급격히 회전하려 할 때, 목표에 도달하기도 전에 미리 반대 방향으로 키를 꺾는 ’카운터 스티어링(Counter-steering)’을 수행한다. 이는 오차의 변화율, 즉 미래의 오차를 예측하여 과도한 오버슈트(Overshoot)를 방지하고 감쇠(Damping)를 제공하는 미분(Derivative) 제어의 본질이다.9
미노르스키는 이러한 인간의 직관적 행동을 미분 방정식으로 정식화하여 3항 제어(Three-term Control) 법칙을 제안하였으나, 당시의 기술적 한계로 인해 즉각적인 산업 표준으로 자리 잡지는 못했다. 그러나 그의 이론은 제임스 클러크 맥스웰(James Clerk Maxwell)의 거버너(Governor) 이론과 함께 현대 피드백 제어의 이론적 토대가 되었으며, 이후 엘머 스퍼리(Elmer Sperry) 등의 연구를 통해 자이로스코프 기반의 자동 항법 장치로 구체화되었다.11
2.2 공압에서 전자로: 산업 표준의 확립
1930년대와 40년대를 거치며 PID 제어는 이론을 넘어 실제 산업 현장의 표준으로 자리 잡기 시작했다. 초기 구현은 오늘날과 같은 디지털 코드가 아니었다. 테일러 인스트루먼트(Taylor Instrument Company)와 같은 기업들은 압축 공기의 압력을 신호로 사용하는 공압식(Pneumatic) 제어기를 개발했다.7 이 기계 장치들은 노즐과 플래퍼, 벨로우즈(Bellows)의 물리적 변위를 이용해 오차의 적분과 미분을 아날로그적으로 연산했다. 당시의 엔지니어들에게 ’튜닝(Tuning)’이란 소프트웨어 파라미터를 입력하는 것이 아니라, 드라이버로 공기 저항 밸브나 스프링의 장력을 조절하는 물리적 행위였다.
제2차 세계대전 이후 전자공학의 발달은 제어기의 형태를 근본적으로 변화시켰다. 연산 증폭기(Operational Amplifier, Op-Amp)의 등장은 미분과 적분 연산을 전압 신호의 조작으로 가능하게 했으며, 이는 제어 시스템의 소형화와 고성능화를 이끌었다.14 1959년 베일리 미터(Bailey Meter Co.)가 최초의 고체 소자(Solid-state) 전자식 제어기를 도입하면서 아날로그 PID 제어의 전성기가 열렸고, 이는 다시 1960년대 후반 마이크로프로세서의 등장과 함께 디지털의 영역으로 넘어오게 된다.14
2.3 PLC의 등장과 알고리즘화된 제어
1968년, 제너럴 모터스(GM)의 요청으로 딕 몰리(Dick Morley) 등이 개발한 프로그래머블 로직 컨트롤러(PLC)는 산업 자동화의 혁명을 일으켰다. 초기 PLC는 복잡한 릴레이(Relay) 배선을 소프트웨어 로직으로 대체하는 시퀀스 제어에 집중했으나, 하드웨어 성능이 향상됨에 따라 PID 알고리즘을 내장 함수 블록(Function Block) 형태로 탑재하기 시작했다.15
앨런 브래들리(Allen-Bradley, 현 Rockwell Automation)의 PLC-5나 지멘스(Siemens)의 S5/S7 시리즈와 같은 초기 모델들은 PID 제어를 표준 명령어로 제공함으로써, 현장 엔지니어들이 복잡한 미분 방정식을 직접 풀지 않고도 제어 루프를 구성할 수 있게 했다.18 이는 PID 제어가 특정 전문가의 전유물에서 벗어나 산업 전반의 범용 도구(Commodity)로 확산되는 결정적인 계기가 되었다. 오늘날 전 세계 산업 제어 루프의 95% 이상이 PID 제어기라는 통계는, 수학적 엄밀함과 현장의 실용성을 동시에 만족시킨 이 알고리즘의 강력함을 증명한다.1
3. PID 제어의 수학적 구조와 물리적 직관
PID 제어기는 설정값(Setpoint, r(t))과 센서를 통해 측정된 실제 출력값(Process Variable, y(t)) 사이의 편차인 오차 e(t) = r(t) - y(t)를 기반으로 제어 입력 u(t)를 생성한다. 연속 시간 도메인에서의 이상적인 PID 제어 식은 다음과 같이 정의된다 1:
u(t) = K_p e(t) + K_i \int_{0}^{t} e(\tau) d\tau + K_d \frac{d}{dt}e(t)
여기서 K_p, K_i, K_d는 각각 비례, 적분, 미분 이득(Gain)을 의미한다. 로보틱스, 특히 모터로 구동되는 관절(Joint) 제어 시스템의 맥락에서 이 세 가지 항은 단순한 수식을 넘어 명확한 물리적 의미를 갖는다. 이를 ’가상의 기계 요소’로 치환하여 해석하면 제어기의 거동을 직관적으로 이해할 수 있다.
3.1 비례 제어 (P): 가상의 스프링 (Virtual Spring)
비례 항 K_p e(t)는 현재의 오차 크기에 비례하여 복원력을 생성한다. 이는 물리학적으로 **스프링(Spring)**의 거동과 정확히 일치한다. 훅의 법칙(Hooke’s Law) F = -kx에서 스프링 상수 k가 바로 제어기의 비례 이득 K_p에 해당한다.24
- 물리적 해석: 로봇 팔의 관절에 목표 위치 q_{des}와 현재 위치 q를 연결하는 가상의 스프링이 달려 있다고 가정해보자. 오차 \vert q_{des} - q \vert가 커질수록 스프링은 더 강하게 당겨지며, 로봇을 목표 위치로 복귀시키려는 토크를 발생시킨다. K_p 값이 클수록 이 스프링은 더 ’단단(Stiff)’해지며, 외력에 대해 저항하는 힘이 강해진다. 이를 로보틱스에서는 강성(Stiffness) 제어라고도 부른다.27
- 한계점: 순수 비례 제어만으로는 중력이나 마찰과 같은 지속적인 외력이 작용하는 환경에서 목표 위치에 정확히 도달할 수 없다. 스프링이 물체를 들어 올리기 위해서는 일정량 늘어나 있어야 하듯이, 로봇 팔이 중력을 버티기 위해서는 항상 일정한 오차(Steady-state Error)가 존재해야만 비례 토크가 생성되기 때문이다. 이 현상을 잔류 편차라고 하며, 이를 해결하기 위해 적분 항이 필요하다.8
3.2 적분 제어 (I): 누적 오차의 해소와 중력 보상
적분 항 K_i \int e(\tau) d\tau는 시간의 흐름에 따른 오차의 누적합을 계산한다. 비례 제어만으로 해결되지 않는 미세한 잔류 편차가 지속될 경우, 적분기는 이를 시간 차원에서 축적하여 제어 입력을 점진적으로 증가시킨다.1
- 물리적 해석: 적분기는 로봇 시스템에서 자동으로 **중력 보상(Gravity Compensation)**이나 마찰 보상을 수행하는 역할을 한다. 로봇 팔이 목표 지점보다 약간 아래로 처져 있을 때, 비례 스프링만으로는 힘이 부족하다면 적분기는 “오차가 계속되고 있다“는 정보를 바탕으로 추가적인 힘을 서서히 보태어 결국 중력을 이기고 팔을 목표 지점까지 들어 올린다.28
- 부작용과 대책 (Windup): 적분 항은 과거의 모든 오차를 기억하는 ‘메모리’ 효과를 갖기 때문에, 모터가 낼 수 있는 최대 토크 한계(Saturation)에 도달했음에도 불구하고 오차가 해소되지 않으면 적분 값이 비정상적으로 비대해지는 적분 와인드업(Integral Windup) 현상이 발생한다.28 이 상태에서 오차가 해소되어도 적분 항에 쌓인 거대한 값 때문에 제어 입력이 즉시 줄어들지 않아 심각한 오버슈트를 유발한다. 산업용 제어기에서는 이를 방지하기 위해 입력 포화 시 적분 연산을 중지하는 ’Clamping’이나 ‘Anti-windup’ 로직을 필수적으로 적용한다.
3.3 미분 제어 (D): 가상의 댐퍼 (Virtual Damper)
미분 항 K_d \frac{d}{dt}e(t)는 오차의 변화율, 즉 속도 성분에 반응하여 저항력을 생성한다. 이는 물리적으로 댐퍼(Damper, 감쇠기) 또는 점성 마찰(Viscous Friction)과 동일한 역할을 수행한다.24
- 물리적 해석: 로봇 팔이 목표 위치를 향해 빠르게 움직일 때, 미분 항은 그 속도에 비례하는 반대 방향의 힘(브레이크)을 가한다. 물속에서 팔을 휘두를 때 속도가 빠를수록 저항이 커지는 것과 유사하다. 이 ’가상의 점성’은 시스템의 운동 에너지를 소산시켜 오버슈트를 억제하고 진동을 빠르게 안정화(Settling)시킨다.31
- 실용적 고려: 미분 항은 미래의 오차를 예측하여 선제적으로 대응하는 강력한 기능을 제공하지만, 고주파 노이즈에 매우 취약하다는 단점이 있다. 센서 신호에 섞인 미세한 잡음은 미분 연산을 통해 급격한 스파이크(Noise Amplification)로 증폭되어 모터에 무리를 줄 수 있다. 따라서 실제 구현 시에는 미분 항에 저주파 통과 필터(Low-pass Filter)를 결합한 형태가 주로 사용된다.33
4. 로보틱스와 SOTA 인공지능의 융합: 계층적 제어의 미학
최근 딥러닝(Deep Learning)과 강화학습(Reinforcement Learning, RL)이 로봇 제어의 새로운 패러다임으로 부상하면서, 일각에서는 고전적인 PID 제어가 설 자리를 잃을 것이라는 성급한 예측을 내놓기도 했다. 그러나 SOTA 로보틱스 연구 결과와 최신 논문들은 정반대의 결론을 보여준다. PID 제어는 사라진 것이 아니라, 인공지능이라는 ‘두뇌’ 아래에서 더욱 정교하고 강인한 ’근육’이자 ’반사 신경’으로 진화했다.
4.1 계층적 제어 아키텍처 (Hierarchical Control Architecture)
현대의 고성능 로봇 시스템(예: 사족 보행 로봇 ANYmal, 휴머노이드, 산업용 매니퓰레이터)은 철저한 **계층적 제어 구조(Hierarchical Control Architecture)**를 채택하고 있다.3 이 구조는 제어 주파수와 추상화 레벨에 따라 상위 제어기와 하위 제어기로 명확히 분업화된다.
| 계층 (Level) | 주요 역할 (Role) | 제어 주기 (Frequency) | 핵심 기술 (Technology) |
|---|---|---|---|
| 상위 (High-Level) | 경로 계획, 전략 수립, 장애물 회피, 보행 패턴 생성 | 저주파 (10Hz - 50Hz) | Deep RL, MPC, Vision AI |
| 하위 (Low-Level) | 관절 토크 생성, 자세 유지, 외란 제거, 명령 추종 | 고주파 (1kHz - 10kHz) | PID, Impedance Control |
이 구조에서 상위 레벨의 AI 에이전트(Policy Network)는 카메라나 라이다(LiDAR) 센서 정보를 바탕으로 “오른쪽으로 이동해” 또는 “발을 저 바위 위에 딛어“와 같은 전략적 판단을 내린다. 그리고 이 판단을 관절의 목표 위치(q_{des})나 목표 속도(\dot{q}_{des})의 형태로 하위 제어기에 전달한다. 하위의 PID 제어기는 이 목표를 달성하기 위해 필요한 모터의 전압과 전류를 1000분의 1초 단위로 계산하여 물리적으로 실행한다. 즉, AI는 지휘관(Commander)이고, PID는 이를 수행하는 실행자(Executor)인 셈이다.36
4.2 행동 공간의 설계: 왜 AI는 토크 대신 PID 타겟을 출력하는가?
강화학습을 이용한 로봇 제어 연구에서 가장 중요한 설계 요소 중 하나는 에이전트의 **행동 공간(Action Space)**을 정의하는 것이다. 에이전트가 신경망의 출력으로 모터의 토크(\tau)를 직접 제어하게 할 것인가, 아니면 PID 제어기의 목표 위치(q_{des})를 출력하게 할 것인가에 대한 논쟁은 지난 수년간 치열하게 전개되었다. 결론적으로, 압도적인 다수의 연구와 실제 성공 사례는 PD 타겟(PD Target) 방식의 손을 들어주고 있다.39
왜 딥러닝 모델이 직접 토크를 제어하는 것보다 중간에 고전적인 PID 제어기를 끼워 넣는 것이 더 유리할까?
4.2.1 초기 안정성과 탐색(Exploration)의 효율성
강화학습의 초기 단계에서 에이전트는 환경에 대해 아무것도 모르는 상태로 무작위 행동(Random Exploration)을 수행한다. 만약 행동 공간이 토크(\tau)로 정의되어 있다면, 무작위로 출력되는 토크 값은 로봇을 미친 듯이 떨게 만들거나(High Frequency Oscillation), 순식간에 균형을 잃고 쓰러지게 만든다. 이는 하드웨어 손상을 유발할 뿐만 아니라, 유의미한 학습 데이터를 수집하기도 전에 에피소드가 종료되어 학습 효율을 떨어뜨린다.41
반면, 행동 공간이 PD 제어기의 목표 위치(q_{des})로 정의된 경우, 에이전트가 무작위 위치를 명령하더라도 하위의 PID 제어기가 존재한다. PID 제어기에는 이미 튜닝된 비례 이득(P, 스프링)과 미분 이득(D, 댐퍼)이 내재되어 있어, 로봇은 물리적으로 어느 정도의 강성과 감쇠를 가진 상태로 움직이게 된다. 즉, PID 제어기는 무작위 탐색 과정에서도 로봇이 물리적으로 파괴되거나 발산하지 않도록 잡아주는 안전망(Safety Net) 역할을 수행하며, 이는 학습 속도를 비약적으로 향상시킨다.42
4.2.2 저주파 통과 필터(Low-pass Filtering) 효과와 부드러운 제어
신경망(Neural Network)은 본질적으로 함수 근사기(Function Approximator)이며, 학습 과정이나 입력 노이즈에 의해 불연속적이고 튀는(Jerky) 출력값을 내보낼 수 있다. 이러한 거친 신호가 모터 토크로 직접 전달되면 기계 시스템에 심각한 진동과 마모를 유발한다.
PID 제어기를 중간 계층으로 두면, 물리학적인 스프링-댐퍼 시스템의 특성상 고주파 노이즈가 자연스럽게 걸러지는 저주파 통과 필터(Low-pass Filter) 효과를 얻을 수 있다.4 상위 AI가 다소 거친 목표 위치를 주더라도, 하위 PID 루프는 관성과 댐핑을 이용해 이를 부드러운 궤적으로 변환하여 모터를 구동한다. 이는 로봇의 움직임을 자연스럽게 만들고 에너지 효율을 높이는 핵심 요인이 된다.
4.2.3 Sim-to-Real 간극의 최소화
시뮬레이션(Simulation)에서 학습한 AI 모델을 실제 로봇(Real World)에 이식할 때 발생하는 성능 저하, 즉 ’Sim-to-Real Gap’은 로봇 공학의 최대 난제 중 하나이다. 실제 로봇에는 시뮬레이터가 완벽하게 모사할 수 없는 기어의 백래시(Backlash), 마찰, 통신 지연, 유연성 등이 존재한다.44
잘 튜닝된 하위 PID 제어기는 이러한 물리적 불확실성을 자체 피드백 루프를 통해 상당 부분 상쇄(Compensate)해준다. 즉, 상위 AI는 복잡한 물리적 비선형성을 신경 쓸 필요 없이 “대략적인 의도“만을 전달하면, 하위 PID 제어기가 실제 하드웨어의 특성에 맞춰 미세한 오차를 실시간으로 수정하는 분업이 이루어지는 것이다. 이는 AI 모델의 일반화 성능을 높이고 실제 환경에서의 적응력을 강화한다.44
4.3 임피던스 제어(Impedance Control): PID의 물리적 일반화
SOTA 로봇 제어, 특히 인간과 물리적으로 상호작용해야 하는 협동 로봇(Cobot)이나 험지를 주파하는 보행 로봇에서는 단순한 위치 제어 PID를 넘어 **임피던스 제어(Impedance Control)**가 표준으로 사용된다.25 흥미로운 점은, 임피던스 제어식이 사실상 PID 제어식의 물리적 해석이자 확장이라는 것이다.
임피던스 제어의 기본 식은 다음과 같다:
F = K(x_{des} - x) + D(\dot{x}_{des} - \dot{x}) + M(\ddot{x}_{des} - \ddot{x})
여기서 K는 강성(Stiffness), D는 감쇠(Damping), M은 관성(Inertia)을 의미한다. 이는 K_p, K_d 게인을 갖는 PD 제어기와 구조적으로 동일하다. 차이점은 기존의 PID가 “무슨 일이 있어도 오차를 0으로 만들어라(Stiffness \rightarrow \infty)“라는 강한 명령이었다면, 임피던스 제어는 “환경과 접촉하면 스프링처럼 적당히 밀려나라“는 유연성을 부여한다는 것이다.26
최신 연구에서는 강화학습 에이전트가 단순히 목표 위치(x_{des})만을 출력하는 것이 아니라, 상황에 따라 K(강성)와 D(감쇠) 값 자체를 실시간으로 조절하는 가변 임피던스 제어(Variable Impedance Control) 기법이 적용되고 있다.49 예를 들어, 로봇이 문손잡이를 잡기 위해 팔을 뻗을 때는 K를 높여 위치 정밀도를 확보하고, 손잡이를 잡고 문을 당길 때는 K를 낮춰 로봇 팔이 문이 열리는 궤적에 자연스럽게 순응(Compliance)하도록 AI가 제어 파라미터를 동적으로 튜닝하는 것이다. 이는 PID 제어가 AI와 결합하여 얼마나 고차원적인 적응성을 가질 수 있는지를 보여주는 완벽한 사례이다.
5. 피드백 제어의 한계와 보완: 고전과 현대의 조화
PID 제어는 강력하고 범용적이지만, 만능은 아니다. 특히 다관절 로봇과 같은 다입력 다출력(MIMO, Multi-Input Multi-Output) 시스템이나 비선형성이 강한 동역학 시스템에서는 구조적인 한계를 드러낸다. 현대 제어 공학은 이러한 한계를 극복하기 위해 PID를 단독으로 사용하기보다, 모델 기반 제어(Model-Based Control)나 피드포워드(Feedforward) 항을 결합하는 방식을 채택한다.52
5.1 MIMO 시스템과 동적 커플링(Coupling)
로봇 팔의 경우, 어깨 관절을 움직이면 그 반동과 원심력(Centrifugal Force), 코리올리 힘(Coriolis Force)이 팔꿈치와 손목 관절에 토크 외란으로 작용한다. 이를 동적 커플링(Dynamic Coupling)이라 한다. 단순한 PID 제어기는 각 관절을 독립적인 단일 입출력(SISO) 시스템으로 간주하고 제어하므로, 다른 관절에서 넘어오는 이러한 힘을 단순한 외란으로 인식하여 뒤늦게 반응하게 된다. 이는 고속 동작 시 궤적 추종 성능을 떨어뜨리는 주원인이다.55
이를 해결하기 위해 로봇 제어 식에는 PID 피드백 항 외에 피드포워드(Feedforward) 항이 추가된다:
\tau = \tau_{PID} + \tau_{dynamics}(q, \dot{q}, \ddot{q})
\\
\tau = \underbrace{K_p e + K_d \dot{e}}_{\text{Feedback (PID)}} + \underbrace{M(q)\ddot{q}_{des} + C(q, \dot{q})\dot{q}_{des} + g(q)}_{\text{Feedforward (Model-based)}}
여기서 g(q)는 중력 토크, C(q, \dot{q})는 코리올리 및 원심력 토크, M(q)는 관성 행렬이다. 로봇의 동역학 모델(Inverse Dynamics)을 통해 필요한 토크를 미리 계산하여 피드포워드로 찔러주면(\tau_{dynamics}), PID 제어기는 모델과 실제 시스템 사이의 미세한 오차만을 제거하는 역할에 집중할 수 있다.57 최근에는 이 동역학 모델링 부분조차도 신경망으로 학습하여(System ID via AI), 고전 PID 루프에 더욱 정밀한 피드포워드 항을 제공하는 하이브리드 방식이 연구되고 있다.46
5.2 안전 필터(Safety Filter)로서의 고전 제어
인공지능, 특히 딥러닝 기반 제어기는 학습되지 않은(Out-of-Distribution) 상황에서 예측 불가능한 행동을 할 위험이 있다. 확률론적 블랙박스인 AI에게 전적으로 안전을 맡길 수는 없기 때문에, 제어 시스템의 최하단에는 결정론적(Deterministic)이고 수학적으로 검증된 고전 제어 기반의 **안전 필터(Safety Filter)**가 배치된다.60
제어 장벽 함수(Control Barrier Functions, CBF)와 같은 이론은 시스템의 상태가 안전 영역을 벗어나지 않도록 보장한다. 상위 AI가 위험한 명령(예: 사람 쪽으로 급가속)을 내리면, 하위의 안전 필터가 개입하여 이 명령을 물리적 제약 조건(속도 제한, 충돌 방지)을 만족하는 가장 가까운 안전한 제어 입력으로 실시간 보정한다. 이는 자율주행차나 협동 로봇과 같이 안전이 최우선인 시스템에서 PID 및 강건 제어(Robust Control) 이론이 여전히 ’최후의 보루(Last Resort)’로서 필수불가결함을 시사한다.43
6. 결론: 흔들리지 않는 뿌리, 그 위에 피어나는 지능
2.1.1절에서 살펴본 바와 같이, 피드백 루프와 PID 제어는 과거의 유산으로 박제된 기술이 아니다. 그것은 미노르스키의 선박에서 시작하여 공압 시스템과 PLC를 거쳐, 오늘날의 초거대 AI 로봇에 이르기까지 끊임없이 형태를 바꾸며 산업 현장의 불확실성을 통제해 온 자동화의 뿌리이다.
최신 인공지능 기술은 이 뿌리를 뽑아버리는 것이 아니라, 그 위에 접목되어 더 풍성한 열매를 맺고 있다. 딥러닝과 강화학습은 비선형적인 환경 인식과 고수준의 추론을 담당하고, PID 제어는 그 추론을 물리 세계에 안정적으로 착근시키는 실행자 역할을 한다. SOTA 로보틱스 연구들이 토크 제어 대신 PD 타겟을 행동 공간으로 채택하고, 임피던스 제어를 통해 환경 적응성을 높이는 흐름은 이러한 공생 관계를 명확히 보여준다.
따라서 현대의 제어 엔지니어와 로봇 공학자에게 요구되는 역량은, 고전 제어를 낡은 것으로 치부하는 것이 아니라, PID의 물리적 직관(스프링-댐퍼)을 깊이 이해하고 이를 최신 AI 모델의 설계와 안전 필터에 녹여내는 통찰력이다. 미래의 자동화 시스템은 ’AI 대(Vs) PID’의 대결 구도가 아닌, AI가 PID 파라미터를 최적화하고 PID가 AI의 불안정성을 보완하는 ‘AI-Enhanced PID’ 또는 **‘PID-Grounded AI’**의 형태로 발전할 것이다. 가장 복잡한 지능도 결국은 가장 기본적인 피드백 루프를 통해 비로소 물리적 실체를 갖게 됨을 기억해야 한다.
6.1 표 2.1.1: 고전 PID 제어와 AI 기반 제어의 역할 비교 및 통합
| 특성 (Characteristics) | 고전 PID 제어 (Classical PID) | AI 기반 제어 (AI/Reinforcement Learning) | 통합 모델 (Integrated / Hierarchical) |
|---|---|---|---|
| 주요 역할 | 설정값 추종, 외란 제거, 시스템 안정화 | 경로 계획, 전략 수립, 비정형 환경 인식 | AI가 전략 수립 \rightarrow PID가 실행 |
| 작동 원리 | 오차(Error) 기반 피드백 (P, I, D) | 데이터 기반 학습, 보상(Reward) 최대화 | 계층적 제어 (Hierarchical Control) |
| 모델 의존성 | 모델 불필요 (Model-free), 튜닝 필요 | 데이터 의존적, 훈련 환경 필요 | Sim-to-Real 강인성 확보 |
| 처리 속도 | 초고속 (kHz 단위), 실시간성 보장 | 상대적 저속 (Hz 단위), 연산량 과다 | 고주파 제어는 PID, 저주파 판단은 AI |
| 안전성 | 예측 가능, 안정성 증명 가능 (Stability) | 예측 불가능성(Black-box), 안전 보장 난해 | AI 출력단에 PID/CBF 안전 필터 적용 |
| 물리적 해석 | 스프링(P), 댐퍼(D), 중력보상(I) | 최적 행동 정책 (Policy) | 가변 임피던스 (AI가 K, D 게인 조절) |
7. 참고 문헌 및 주석
본문의 기술적 분석과 역사적 사실은 다음의 연구 자료들을 종합하여 재구성되었다.
- PID의 기원과 역사: 미노르스키의 선박 조향 연구와 PID 정립 5, 공압식 제어에서 전자식/PLC로의 진화.11
- PID의 원리와 물리적 직관: P, I, D 각 항의 역할과 튜닝 1, 로보틱스에서의 스프링-댐퍼 해석.24
- SOTA AI와 로보틱스의 통합: 강화학습의 행동 공간(PD Target vs Torque) 분석 39, 계층적 제어 아키텍처 3, 임피던스 제어 및 안전 필터.34
- 산업 표준 및 응용: PLC 내 PID 블록의 활용 18, MIMO 시스템과 피드포워드 제어.52
8. 참고 자료
- The PID Controller & Theory Explained - NI - National Instruments, https://www.ni.com/en/shop/labview/pid-theory-explained.html
- PID Controllers in the Age of AI Unleashing the Power of PID Control with Artificial Intelligence | by Theta Controls | Medium, https://medium.com/@thetacontrolsdm/pid-controllers-in-the-age-of-ai-unleashing-the-power-of-pid-control-with-artificial-intelligence-3400d0d217fa
- A reinforcement learning control approach for underwater manipulation under position and torque constraints - Reach Robotics, https://reachrobotics.com/media/2020/10/RL_Oceans_2020_full_article_1.pdf
- Learning-Based Joint Control with Hierarchical Reinforcement Learning and On-Device Execution - IEEE Xplore, https://ieeexplore.ieee.org/iel8/7083369/7339444/11206440.pdf
- Nicolas Minorsky, father of the PID controller - Kalopa Robotics, https://kalopa.com/blog/2023-04-02-nicolas-minorsky-father-of-the-pid-controller
- Directional stability of automatically steered bodies (2009) | N. Minorsky | 450 Citations, https://scispace.com/papers/directional-stability-of-automatically-steered-bodies-1uydge70au
- Nicolas Minorsky and the Automatic Steering of Ships - Robotics, http://robotics.caltech.edu/wiki/images/1/15/Minorsky_Paper.pdf
- A Century of Powerful PID Control - Emerson Automation Experts, https://www.emersonautomationexperts.com/2022/top-quartile-operational-certainty/century-of-powerful-pid-control/
- HOW do helmsmen steer the ship based also on past errors? - Reddit, https://www.reddit.com/r/Ships/comments/1erpuz0/how_do_helmsmen_steer_the_ship_based_also_on_past/
- Nicolas Minorsky and The Automatic Steering of Ships - S. Bennett | PDF | Control Theory, https://www.scribd.com/document/219298014/Nicolas-Minorsky-and-the-Automatic-Steering-of-Ships-S-Bennett
- Proportional–integral–derivative controller - Wikipedia, https://en.wikipedia.org/wiki/Proportional%E2%80%93integral%E2%80%93derivative_controller
- PID Control History and Advancements - Emerson Automation Experts, https://www.emersonautomationexperts.com/2013/control-safety-systems/pid-control-history-and-advancements/
- The past of PID controllers | Request PDF - ResearchGate, https://www.researchgate.net/publication/223704858_The_past_of_PID_controllers
- PID control: the early years - Arrow@TU Dublin, https://arrow.tudublin.ie/cgi/viewcontent.cgi?article=1088&context=engscheleart
- History of the PLC | Library.AutomationDirect.com | #1 Value, https://library.automationdirect.com/history-of-the-plc/
- The History of Programmable Logic Controllers: From Then to Now - c3controls.com, https://www.c3controls.com/white-paper/history-of-programmable-logic-controllers
- The History of Rockwell Allen Bradley PLC Systems | R.L. Consulting, Inc., https://rlconsultinginc.com/the-history-of-rockwell-allen-bradley-plc-systems/
- Allen-Bradley PLCs - A Hardware History - Technical Articles - Control.com, https://control.com/technical-articles/allen-bradley-plcs-a-hardware-history/
- Chapter 19 Programming the PID Algorithm - Hybrid PLC/Mechatronics, https://hybridplc.org/wp-content/uploads/chap19_S.pdf
- An Introduction to Allen-Bradley PLC | Rockwell Automation - RealPars, https://www.realpars.com/blog/allen-bradley-plc
- PID Control, http://www.cds.caltech.edu/~murray/courses/cds101/fa02/caltech/astrom-ch6.pdf
- PLC or PID Controller: What’s the difference and how do you decide what technology you need? - Eurotherm, https://www.eurotherm.com/us/temperature-control-us/plc-or-pid-controller-whats-the-difference-and-how-do-you-decide-what-technology-you-need/
- Introduction to PID — FIRST Robotics Competition documentation - WPILib Docs, https://docs.wpilib.org/en/stable/docs/software/advanced-controls/introduction/introduction-to-pid.html
- Dynamic Modeling and Analysis of Industrial Robots for Enhanced Manufacturing Precision, https://www.mdpi.com/2076-0825/14/7/311
- Impedance Control – Modeling, Motion Planning, and Control of Manipulators and Mobile Robots - Clemson University Open Textbooks, https://opentextbooks.clemson.edu/wangrobotics/chapter/impedance-control/
- Impedance Control - Robotics Explained, https://robotics-explained.com/impedancecontrol/
- Ch. 8 - Manipulator Control, https://manipulation.csail.mit.edu/force.html
- Deep Dive: Understanding PID Control for Robot Motor Stabilization, https://keyirobot.com/blogs/buying-guide/deep-dive-understanding-pid-control-for-robot-motor-stabilization
- I don’t understand Integral part of PID controller - Robotics Stack Exchange, https://robotics.stackexchange.com/questions/499/i-dont-understand-integral-part-of-pid-controller
- Integral Windup Method in PID Control - Technical Articles, https://control.com/technical-articles/intergral-windup-method-in-pid-control/
- Automation’s Unsung Hero: Why PID Control Still Matters in the Era of Al and loT, https://www.automate.org/news/automations-unsung-hero-why-pid-control-still-matters-in-the-era-of-al-and-lot-83
- PID control of a mass-spring-damper (Kevin Lynch) - YouTube, https://www.youtube.com/watch?v=T9_C3jhnQXI
- PID tuning for 6 dof robotic arm - Robotics Stack Exchange, https://robotics.stackexchange.com/questions/8575/pid-tuning-for-6-dof-robotic-arm
- Admittance control for physical human–robot interaction - https ://ris.utwen te.nl, https://ris.utwente.nl/ws/files/29087621/admittance.pdf
- [2511.06500] Adaptive PID Control for Robotic Systems via Hierarchical Meta-Learning and Reinforcement Learning with Physics-Based Data Augmentation - arXiv, https://arxiv.org/abs/2511.06500
- Hierarchical control system on ANYmal. | Download Scientific Diagram - ResearchGate, https://www.researchgate.net/figure/Hierarchical-control-system-on-ANYmal_fig4_337574933
- ANYmal Parkour: Learning Agile Navigation for Quadrupedal Robots - YouTube, https://www.youtube.com/watch?v=PjWvf90l4cg
- Deep Reinforcement Learning for Robotics: A Survey of Real-World Successes - arXiv, https://arxiv.org/html/2408.03539v1
- Safe Learning for Contact-Rich Robot Tasks: A Survey from Classical Learning-Based Methods to Safe Foundation Models - arXiv, https://arxiv.org/html/2512.11908v1
- Learning Torque Control for Quadrupedal Locomotion - Hybrid Robotics, https://hybrid-robotics.berkeley.edu/publications/Humanoids2023_RL_TorqueControl.pdf
- Action Space Design – Reinforcement Learning for Robot Motor Skills » Lamarr-Blog, https://lamarr-institute.org/blog/action-space-design-reinforcement-learning/
- Action Space Design in Reinforcement Learning for Robot Motor Skills - GitHub, https://raw.githubusercontent.com/mlresearch/v270/main/assets/esser25a/esser25a.pdf
- Q-learning-based Model-free Safety Filter - arXiv, https://arxiv.org/html/2411.19809v1
- On the Role of the Action Space in Robot Manipulation Learning and Sim-to-Real Transfer, https://arxiv.org/html/2312.03673v1
- Reinforcement learning for non-prehensile manipulation: Transfer from simulation to physical system - Roboti LLC, https://roboti.us/lab/papers/LowreySIMPAR18.pdf
- Data-Driven Dynamic Parameter Learning of manipulator robots - arXiv, https://arxiv.org/html/2512.08767v1
- [Question] PD Torque Behavior in Isaac Lab and Policy Actions Are Too High and Don’t Match Actual Joint Pos #4121 - GitHub, https://github.com/isaac-sim/IsaacLab/discussions/4121
- Watch Less, Feel More: Sim-to-Real RL for Generalizable Articulated Object Manipulation via Motion Adaptation and Impedance Control - arXiv, https://arxiv.org/html/2502.14457v1
- Impedance Control for Variable Stiffness Mechanisms with Nonlinear Joint Coupling, https://elib.dlr.de/55819/1/1069.pdf
- Choosing Stiffness and Damping for Optimal Impedance Planning - University of Edinburgh Research Explorer, https://www.research.ed.ac.uk/files/313473567/Choosing_Stiffness_POLLAYIL_DOA01112022_AFV.pdf
- Reinforcement Learning for Robotic Assembly with Force Control - UC Berkeley EECS, https://www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-20.pdf
- What are the limitations of using the PID controller? - Quora, https://www.quora.com/What-are-the-limitations-of-using-the-PID-controller
- PID Control Design for Complex MIMO Systems : r/ControlTheory - Reddit, https://www.reddit.com/r/ControlTheory/comments/1egcq83/pid_control_design_for_complex_mimo_systems/
- Motion and Force Control – Modeling, Motion Planning, and Control of Manipulators and Mobile Robots - Clemson University Open Textbooks, https://opentextbooks.clemson.edu/wangrobotics/chapter/motion-and-force-control/
- The Analysis of Coriolis Effect on a Robot Manipulator - IJIET, https://ijiet.com/wp-content/uploads/2016/12/1156.pdf
- H∞ CONTROL FOR A CONTROLLED FLOATING ROBOTIC SPACECRAFT - Surrey Open Research repository, https://openresearch.surrey.ac.uk/esploro/fulltext/conferencePresentation/H-INFINITY-CONTROL-FOR-A-CONTROLLED/99512973302346?repId=12139025090002346&mId=13140278310002346&institution=44SUR_INST
- A plain-English description of PID (Proportional Integral Derivative) control : r/AskEngineers, https://www.reddit.com/r/AskEngineers/comments/nvrc7r/a_plainenglish_description_of_pid_proportional/
- Position–Force Control of a Lower-Limb Rehabilitation Robot Using a Force Feed-Forward and Compensative Gravity Proportional Derivative Method - MDPI, https://www.mdpi.com/2079-9292/13/22/4494
- PD Control with On-line Gravity Compensation for Robots with Flexible Links, https://www.researchgate.net/publication/242072610_PD_Control_with_On-line_Gravity_Compensation_for_Robots_with_Flexible_Links
- Robust and Safe Multi-Agent Reinforcement Learning with Communication for Autonomous Vehicles: From Simulation to Hardware - arXiv, https://arxiv.org/html/2506.00982v2
- Data-Driven Safety Filters - Hybrid Robotics, https://hybrid-robotics.berkeley.edu/publications/CSM2023_Safety_Filters.pdf
- Enhancing Safety and Performance in Multi-agent Systems and Soft Robots via Reinforcement Learning, https://www.ri.cmu.edu/app/uploads/2025/08/MSR_Thesis_CMU.pdf
- Stanford Seminar - Continual Safety Assurances for Learning-Enabled Robotic Systems, https://www.youtube.com/watch?v=jeJ4x1EyIFM